TUGAS LAB IF540 MACHINE LEARNING

WEEK [12] : [Reinforcement Learning]

Semester Ganjil 2022/2023


Dataset yang dipakai:

  1. [Nama dataset1] – sumber : [cantumkan link dataset]
  2. [Nama dataset2] – sumber : [cantumkan link dataset]

Hasil kerja

Kesimpulan

Berikan simpulan yang dilakukan dari hasil kerja menggunakan algoritma dan 2 dataset yang dipilih. Simpulan bisa berkisar antara (bisa di modifikasi):

- Reinforcement learning dengan menggunakan Q-values berguna untuk meningkatkan kemampuan belajar dari suatu agent. Metode ini menggunakan Action Values, Rewards dan Episodes, Temporal Difference, dan memilih aksi dengan aturan epsilon-greedy.
- Bot ini juga bisa dilatih dengan Environment Clues, sehingga ketika di training dengan menggunakan kasus nyata, bot akan terlatih lebih realistis.
- Dengan menggunakan environment Taxi-v3, pelatihat bot terlihat lebih realistis lagi karena kasusnya kita hampir temui di kehidupan sehari-hari
- SARSA adalah On Policy dan menggunakan aksi yang telah dilakukan dengan autran yang sedang berlaku untuk memperlajari Q-value. Kemudian percobaan dilakukan dengan encironment FrozenLake-v1, Terlihat agent bisa memilih jalur jalan sesuai dengan keadaan yang ia temui.

Save the notebook, then convert the notebook to html (by running the next code).

Next step:

Markdown basics https://markdown-guide.readthedocs.io/en/latest/basics.html#